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(57) Abstract 

A protein having at least 65 % sequence homology with the sequence (I). This protein may particularly be hard wheat or soft wheat 
thioredoxin h. The DNA corresponding to said protein may be integrated Into an expression vector for production by microorganisms. 

(57) Abrtg* 

Protiine prfsentant une similitude de sequence d'au moms 65 % avec la sequence (I). Certe protCine peut etre en particulier la 
thiortdoxine h de b\6 dur ou dc ble* tendre. L'ADN correspondant a cctte proline peut etre integr* dans un vecteur d'expression en vue de 
sa production par des micro-organismes. 
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Thioredoxines h de ble tendre et de ble 
dur et proteines presentant des similitudes, 
fragments d'ADN codant pour ces proteines 
et procedes d'obtention 

La presente invention a pour objet des 
thioredoxines h de ble tendre et de ble dur, des 
proteines presentant des similitudes ainsi que des 
fragments d'ADN codant pour ces proteines. 

Elle est en outre relative a des procedes 
d'obtention de ces proteines. 

Les thioredoxines sont des proteines de petites 
15 tallies iropliquees dans divers processus biologiques 
et vraisemblablement presentes dans tous les 
organismes vivants . 

Elles interviennent entre autres conune donneurs 
d'hydrogene pour des reductases (ribonucleotide, 
20 methionine sulfoxyde et sulfate reductase) et comme 
oxydoreductases des fonctions disulfure de plusieurs 
proteines. Pour les proprietes generales des 
thioredoxines on pourra avantageusement se referer a 
la revue de Pille (Annales de l'Institut Pasteur, 
25 volume 1, 34-50, 1992) ou de Holmgren (TIBS , Janvier 

1981, 26-29) . 

Si les thioredoxines de bacteries sont bien 

connues, les thioredoxines h des organismes 

superieurs, et en particulier des plantes ont ete 

30 assez peu etudiees . 

Ainsi, seules les thioredoxines h de tabac 
(Marty et Meyer, Plant Molecular Biology, 17, 143-147, 
1991; Brugidou et al., Mol Gen Genet , 238, 285-293, 
1993), de riz ( sequence EMBL N* D 26547), 

35 d'Arabidopsis thaliana ( Rivera-Madrid et al., Plant 
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Physiol, 102, 327-328, 1993 )et de Chlamydomonas 
relnhardtii (Decottignles et al. Eur. J. Biochem, 198, 
505-512, 1991) ont ete a ce jour sequencees . 

Leur sequencage a ete effectue a partir d'ADN 
5 complementaire selectionne dans des banques d'ADN de 
tabac ou d* Arabldopsis thaliana par hybridation du 
clone portant l'ADN complementaire codant pour la 
thioredoxine h avec une sonde correspondant a un ADN 
complementaire de la thioredoxine hi de tabac pour 
10 Arabldopsis thaliana ( Rivera-Madrid et al. 
precedemment cite), c'est-a-dire une sonde 
heterologue, ou apres criblage par hybridation 
dif ferentielle (Marty et Meyer, precedemment cites). 

Zhong-Ru Gan (J. Biol. Chem, 1991, 266 (3), 
15 1692-1696) a sequence une thioredoxine de levure. Des 
amorces correspondant a des sequences encadrant le 
site actif de cette thioredoxine ont ete utilisees 
pour amplifier un fragment de 34 paires de base. Ce 
fragment a alors ete utilise comme sonde dans une 
20 hybridation du type Southern pour le criblage d'une 
banque genomique de levure. 

Muller et Buchanan (J. Biol. Chem. 1989, 264 
(7), 4008-4014) ont quant a eux decrits le clonage 
d'un gene codant pour une thioredoxine m, et non une 
25 thioredoxine h. La strategic utilisee pour le clonage 
consiste a faire une hybridation du type southern du 
genome de la bacterie Anacystis nidulans, avec une 
sonde presentant des similitudes avec les sites actifs 
d'autres thioredoxines m puis a doner le fragment 
30 correspondant. 



A la connaissance du demandeur, les seules 
sequences de thioredoxine h de plantes qui etaient 
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publiees, et pouvaient done etre utilisees comme 
sondes, 6taient celles de tabac et de Chlamydomonas 
reinhardtii; e'est-a-dire d'une plante dicotyledone et 
d'une algue unicellulaire . 
5 Ces sondes s'hybrident de maniere heterologue 

avec des ADN complementaires d'autres plantes 
presentant une grande distance evolutive, les mono- 
cotyledones . 

Ainsi, l'homme du metier desireux de 

10 selectionner des clones d 1 ADN complementaires dans des 
banques de plantes mono-cotyledones etait incite a 
utiliser des sondes heterologies , done peu 
specif iques, et ce d'autant plus qu'excepte le site 
actif, il existe peu de similarity entre les sequences 

15 de thioredoxines h, et induisant ainsi des risques 
d'erreurs dans la selection des clones empechant toute 
selection specif ique. 

Or # les thioredoxines h interviennent de 
maniere importante chez le bl6 lors de la germination, 

20 et aussi en reduisant de maniere specifique les 
glutenines et d'autres proteines du grain de ble 
(Kobrehel et al, 1992, Plant Physiol., 99, 919-924). 
Afin d'ameliorer la qualite de la farine de ble, par 
exemple l'etat d •oxydo-reduction de certaines 

25 proteines contenues dans cette farine, on peut 
modifier l'activite des thioredoxines h, au niveau 
genetique, en modifiant les genes des thioredoxines h 
ou en ajoutant de nouvelles copies de ces genes ou 
d 'ADN complementaires correspondant a ces genes. 

30 II peut etre aussi envisage de rajouter des 

thioredoxines produites par des microorganismes dans 
des produits a usage alimentaire, ou de les utiliser 
pour supprimer l'effet antinutritionnel des 
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legumineuses ou pour inactiver des toxines, par 
exemple de venin d'abeilles ou de serpents. Dans tous 
ces cas, il peut etre necessaire, voire indispensable, 
d'utiliser des ADN complSmentaires correspondant au 
5 gene de thioredoxine h pour produire ces proteines. 

L'horame du metier se trouvait done confronte a 
une absence de methode fiable permettant la selection 
dans une banque d f ADN complementaire, de clones ccdant 
pour les thioredoxines h. 

10 Le demandeur s'est done attache a rechercher 

une sonde permettant de selectionner de maniere 
specifique et fiable des clones de thioredoxine h dans 
une banque d 1 ADN complementaire. 

II a montre qu'il etait possible d'effectuer 

15 une telle selection en utilisant une sonde codant pour 
une sequence d'acides amines composant le site actif 
des thioredoxines . 

II a en outre montre que les thioredoxines h de 
bles dur et tendre presentent d'une part une grande 

20 similitude entre elles, mais d' autre part des grandes 
differences de structure primaire par rapport aux 
autres thioredoxines h de plantes dont les sequences 
sont deja connues. 

La presente invention a pour objet des 

25 proteines pr6sentant une similitude de sequence d'au 
moins 65% avec la sequence SEQ ID N' 1 suivante: 
Gly Glu Val He Ser Val His Ser Leu Glu Gin Trp Thr 
Met Gin He Glu Glu Ala Asn Ala Ala Lys Lys Leu Val 
Val He Asp Phe Thr Ala Ser Trp Cys Gly Pro Cys Arg 

30 He Met Ala Pro He Phe Ala Asp Leu Ala Lys Lys Phe 
Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp Glu Leu 
Lys Pro He Ala Glu Gin Phe Ser Val Glu Ala Met Pro 
Thr Phe Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg 
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Val Val Gly Ala lie Lys Glu Glu Leu Thr Thr Lys Val 
Gly Leu His Ala Ala 

Preferentiellement, de telles proteines 
pr6sentent une similitude avec la sequence SEQ ID N # l 
5 d'au moins 75% et encore plus preferentiellement d'au 
moins 85 %. 

La presente invention a ainsi pour objet la 
thioredoxine h de ble tendre presentant la sequence 
SEQ ID N*3 suivante: 

10 
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Des peptides comprenant au moins un fragment 
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d'une de ces proteines font aussi partie de la 
presents invention. 

La presente invention a en outre pour objet des 
fragments d'ADN codant pour une de ces proteines ou un 
5 de ces peptides et en particulier un fragment codant 
pour la thioredoxine h de ble tendre comprenant la 
sequence SEQ ID N* 2 suivante: 

ATGGCGGCGT CGGCGGCGAC GGCGACGGCG ACGGCGGCGG CGGTAGGGGC 
GGGGGAGGTG ATCTCCGTCC ACAGCCTGGA GCAGTGGACC ATGCAGATCG 

10 AGGAGGCCAA CGCCGCCAAG AAGCTGGTGG TGATTGACTT CACTGCATCA 
TGGTGCGGAC CATGCCGCAT TATGGCTCCA ATTTTCGCTG ATCTCGCCAA 
GAAGTTCCCA GCTGCTGTTT TCCTCAAGGT CGACGTTGAT GAACTGAAGC 
CCATTGCTGA GCAATTCAGC GTGGAGGCCA TGCCAACCTT CCTGTTCATG 
AAGGAAGGAG ATGTCAAGGA CAGGGTTGTC GGAGCTATCA AGGAGGAACT 

15 GACGACCAAG GTTGGGCTAC ACGCGGCCCA GTAA 

et un fragment codant pour la thioredoxine de ble dur 
comprenant la sequence SEQ ID N'4 suivante : 
ATGGCGGCGG CGGCGACGGC GACGACTACA GCGGCGGCGA CGGCGGCGGC 
GGTGGGGCCG GGGGAGGTGA TCTCCGTCCA CAGCCTGGAG CAGTGGACCA 

20 TGCAGATCGA GGAGGCCAAC GCCGCCAAGA AGCTGGTGGT GATTGACTTC 
ACTGCATCAT GGTGCGGACC ATGCCGCATC ATGGCTCCAA TTTTTGCTGA 
TCTCGCCAAG AAGTTCCCAG CTGCTGTTTT CCTCAAGGTC GACGTTGATG 
AACTGAAGCC CATTGCTGAG CAATTCAGCG TCGAGGCCAT GCCAACCTTC 
CTGTTCATGA AGGAAGGAGA CGTCAAGGAC AGGGTTGTCG GAGCTATCAA 

25 GGAGGAGCTG ACGACCAAGG TTGGGCTCCA CGCGGCTGCC TAG 

Elle a aussi pour objet une methode de 
selection dans une banque d'ADN complementaire de 
clones codant pour une thioredoxine h caracterisee en 
ce qu'on hybride lesdits clones avec une sonde 

30 presentant une similitude de sequences proche de 100% 
avec le site actif des thioredoxines . 

Avantageusement, une telle sonde presente la 
sequence suivante : (SEQ ID N* 6) 
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TGGTGX jGGX2 CCX^TGX^ AAXg ATG 

dans laquelle : 

X 1 represente C ou T 
X 2 represente T ou A 
5 X 3 represente A, G, C ou T 

X 4 represente C ou T 
X 5 represente G ou A 

On remarquera, comme le montrent les 
comparaisons effectuees dans les exemples qui suivent 

10 , que les thioredoxines h de ble presentent une grande 
difference de structure primalre par rapport aux 
thioredoxines h de plantes deja connues. 

II n'etait done en rien evident pour l'homme du 
metier de deduire les sequences de ces thioredoxines h 

15 de ble des sequences d'autres thioredoxines h 
divulguees dans l'etat de la technique. 

En outre, l'obtention d 1 ADN complementaires 
(ADNc) pour un gene donne n'est pas, malgre les 
developpements recents dans les techniques de biologie 

20 moleculaire, une technique de routine. 

En effet, l'obtention d'un ADNc particulier 
necessite la mise au point d'un procede specif ique qui 
va bien au-dela d'une simple adaptation d'une 
technique. En particulier le choix du materiel dont 

25 sont extraits les ARN messagers est essentiel. Cette 
specif icite est d'autant renforcee que les ARN 
messagers sont en faibles quantites ce qui est le cas 
de la presente invention. 

On notera de plus que 1 1 utilisation 

30 d' oligonucleotides degeneres pour cribler les ADN 
complementaires n'avait jamais ete mise en oeuvre dans 
le cas des thioredoxines h . II n'etait en rien 
evident qu'une telle utilisation permette un criblage 
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ef f icace • 

Le ble est une gramlnee d'un poids economique 
considerable et son amelioration, ainsi que celle de 
ses produits en utilisant les thioredoxines h ou des 
5 fragments d 1 ADN codant pour ces proteines, constituent 
des progrSs techniques importants. 

La presente invention est de plus relative a 
des vecteurs d* expression portant un fragment d'ADN 
tel que defini ci-dessus, et en particulier portant au 
10 moins une partie de la sequence SEQ ID N*2 ou de la 
sequence SEQ ID N*4 decrites ci-dessus. 

De tels vecteurs coraprennent au moins : 

- une origine de replication adaptee a l'espece 
biologique, microorganisme ou autre, dans laquelle on 

15 souhaite reproduire le vecteur; 

- un promoteur situe en amont du fragment d'ADN 
, adapte a l'espece biologique dans laquelle on 
souhaite exprimer les proteines selon 1' invention. 

lis peuvent aussi comprendre des sequences de 
20 regulation de 1* expression du promoteur, Ce promoteur 
peut etre soumis a regulation selon les conditions de 
culture des microorganismes . 

De tels vecteurs peuvent Stre particulierement 
des vecteurs de secretion, ou d'excretion. 
25 De mani£re avantageuse, les fragments d'ADN 

definis ci-dessus sont integres dans un plasmide, et 
en particulier dans le plasmide pET commercialise par 

Novagen (USA) . 

Des vecteurs pETtrxTa et pFLSltrxTa portant la 
30 sequence identifiee ci-dessus SEQ ID N # 2 ont ete 
deposes respectivement sous les numeros 1-1442 et I- 
1443 aupres de la Collection Nationale de Cultures de 
Microorganismes de l'Institut Pasteur ( CNCM) . 
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D'autres objets de la presente invention sont 
des microorganismes , des cellules eucaryotes, et en 
particulier des cellules vegetales ou animales, et des 
plantes transgeniques portant une des sequences 
5 definies ci-dessus. Un tel microorganisme est 
avantageusement une bacterie, telle que E. coli ou une 
corynebacterie, une levure ou un champignon 
filamenteux. Des cellules animales peuvent etre, par 
exemple, des cellules d'insectes. 

10 Les esp&ces biologiques portant ces fragments 

et/ou vecteurs sont choisies afin de permettre une 
expression des proteines selon 1' invention. 

Enfin, la presente invention est relative a un 
procede de production des proteines selon 1' invention, 

15 et en particulier de thioredoxines h, comprenant les 
etapes sulvantes : 

- culture d'un microorganisme tel que defini 

ci-dessus, et 

- isolement des proteines ou peptides selon 
20 1* invention produits par ledit microorganisme, 

Le present procede n'est pas limite a 
I'obtention de derives de thioredoxines h de ble. II 
peut aussi etre applique a la production de 
thioredoxines h d'autres cereales telles que le mais, 
25 l'orge, le seigle, le sorgho ou le riz, de 
legumineuses telles que le soja, 1' haricot ou le pois 
ou d'oleagineux tels que le tournesol, le chanvre, le 
lin ou le colza, ou de derives de ces thioredoxines h, 
a l'aide de vecteurs portant des sequences codant pour 

30 ces proteines. 

Avantageusement, les microorganismes sont lyses 
apres culture et les proteines selon 1' invention sont 
recuperees par des methodes connues de l'homme du 
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metier. 

L'homme du metier pourra se referer, si 
necessaire, pour la preparation des proteines selon 
1' invention, de leurs vecteurs ou de microorganismes 
5 portant ces vecteurs, et de maniere generale pour la 
mlse en oeuvre de la presente invention au manuel 
suivant : Maniatis et al. Molecular cloning : A 
Laboratory Manual , Cold Spring Harbor Laboratory 1982 
ou a une de ses recentes renditions. 

10 Les proteines objets de la presente invention 

ou pouvant etre obtenues selon un procede objet de la 
presente invention peuvent etre utilisees dans de 
nombreuses applications, en particulier, comme 
additifs dans des produits a usage alimentaire ou non 

15 alimentaire, pour la suppression de l'effet 
antinutritionnel des legumineuses , pour 1 ' inactivation 
de diverses toxines en particulier celles de venin 
d'abeilles et de serpents. 

Ces applications et d'autres applications sont 

20 repertories dans la demande PCT/US 92/08 595 dont le 
contenu est integre a la presente demande par 
reference . 

La production de thioredoxine h de ble dans la 
levure, en particulier Saccharomyces cerevisiae, 

25 permet de l'utiliser dlrectement dans les produits 
alimentaires sous forme de levures enrichies en 
thioredoxine h (par induction de 1 'expression du gene 
ou par accumulation de la thioredoxine h dans la 
levure), sous forme lyophilisee par exemple. 

30 Le fait d'obtenir des thioredoxines h de ble 

par le procede selon 1' invention permet de les ajouter 
a un produit consomme par les humains tout en leur 
conservant leur caractere naturel . 
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La presente invention permet en outre d'obtenir 
de la thioredoxine h de ble en quantite importante 
(par rapport a une purification a partir de ble) par 
exemple a partir de cultures de bacteries ou de 
5 levures et d' a j outer cette thioredoxine h, apres 
purification ou en utilisant des levures enrichies 
(surexprimant la thioredoxine h) , a des produits 
cerealiers en vue d'ameliorer leur valeur 
d'utilisation. 

10 Le fait de disposer des sequences codant pour 

les thioredoxines h de bles dur ou tendre permet de 
les modifier par mutagenese dirigee et d'obtenir des 
thioredoxines h dont les proprietes sont modifiees, et 
en particulier dont l'activite est amelioree par 

15 rapport a celle de la thioredoxine h isolee du ble. 

La presente invention est illustree sans pour 
autant etre limitee par les exemples qui suivent dans 
lesquels : 

La figure 1 illustre les differences de 
20 sequences des thioredoxines h de ble tendre 
(THIOBLETA) de ble dur (THIOBLETD), de riz (THIORIZ), 
d'Arabidobsis (THIOARA) , de thioredoxine h2 de tabac 
(THIOTABAC2 ) , de thioredoxine hi de tabac (THIOTABAC) 
et de Chlamydomonas reinhardtii (THIOCHLA) . 
25 La figure 2 illustre la construction du 

plasmide pETtrxTa. 

Les figures 3 et 4 representent respectivement 
un gel de polyacrylamide-SDS apres coloration au bleu 
de Coomassie et un Western-blot effectue avec un 
30 anticorps dirige contre la thioredoxine h de ble de : 

1. lysat de bacteries avant induction, 

2. culot des proteines insolubles du lysat 
apres 3h d' induction, 
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3. culot apres chauffage des proteines solubles 
du lysat, 

4. surnageant apres chauffage des proteines 

solubles du lysat, 
5 5. comme 2 apres 6h d' induction/ 

6* comme 3 apres 6h d' induction, 
7. comme 4 apres 6h d' induction. 

Les figures 5 et 6 representent schematiquement 
les plasmides pFL61 et pVT-U 100. 
10 EXEMPLE LS Obtention de clones de thioredoxine h de 
ble tendre 

1* ) Construction de la banaue dTADN 

comolementaire f ADNc) . 

L 1 extraction des ARN totaux de graines et la 
15 selection des ARN poly (A) + ont ete effectuees comme 
decrit par Gautier et al. ( Plant Mol Biol., 14, 313- 
322, 1990). 

5pg d 'ARN poly (A) + issus de graines de 
Triticum aestivum L. , variete capitole en cours de 

20 maturation (23 jours apres floraison ) ont ete 
utilises pour construire une banque d'ADN 
complementaire, en utilisant le Systeme Superscript 
Plasmid commercialise par BRL. 

Les ADN complementaires presentant une taille 

25 superieure a 500 pb sont ligues au plasmide pSPORTl 
commercialise par BRL coupe par les enzymes Notl-Sall, 
qui est utilis§ pour transformer des cellules 
d'Escherichia coli DH5a. 

2.10 5 bacteries recombinantes sont obtenues 

30 avant amplification de la banque. Environ 3000 
recombinants sont etales et les colonies sont 
transferees sur une membrane Hybond C (Amersham) selon 
les instructions du fabricant. 
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2 * ) Isolement d'un clone codant pour une 
thioredoxine h de ble tendre. 

La banque d'ADN complementaire obtenue en 1") 
est criblee a I'aide d'un melange d' oligonucleotides 
5 de synthese presentant la sequence ID N* 6 suivante : 
TGGTGX 1 GGX 2 CCX 3 TGX 4 AAX 5 ATG 
dans laquelle : 

X! represente C ou T 

X 2 represente T ou A 
10 X 3 represente A, G, C ou T 

X 4 represente C ou T 

X 5 represente G ou A 

Un mfelange contenant ces oligonucleotides 
synthetiques marquSs a leurs extremites 5 ' par du 
15 ganuna- 32 P ATP a l'aide de la polynucleotide kinase T4 
a ete utilise. 

Les f litres ont ete prehybrides (16 heures , 
37 *C) et hybrides (4 heures , 37 *C) dans une solution 
comprenant 15% (v/v) de formamide desionise, SSPE 2 X, 
20 solution de Denhardt 5 X, SDS 1 % (poids/volume) et 
de l'ADN de sperme de saumon denature (200 pg/ml) . 

Les filtres hybrides sont laves deux fois dans 
du SSPE 2 X et du SDS 0,1 % ( poids/volume) durant 10 
minutes a temperature ambiante; puis deux fois dans 
25 du SSPE 0,25 X, et du SDS 0,1 % (poids/volume) durant 
30 minutes a 37 "C puis une fois dans du SSPE 0,25 X 
durant 10 minutes & 37 # C. 

lis sont ensuite exposes a des films sensibles 
aux rayons X ( Fuji ) a -70 'C avec deux ecrans 
30 intensifiants . 

Un clone, appele pTaM1338, est isole et sa 
sequence est determinee sur les deux brins en 
utilisant la trousse de sequengage Taq Dye Deoxy 
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Terminator Cycle Sequencing kit commercialise par 
Applied Biosystems et le sequenceur 370 DNA 
automatique commercialise par Applied Biosystems. 

La sequence de l'ADN complementaire du clone 
5 pTaM1338 est la suivante : 
(SEQ ID N'7) 



CAAAGTGCGC GTGAGAAATA AGCGGTGCTT GCCCAGTAGA GAGAGAGAGA 
10 GAGAGAGAGA GAGATGGCGG CGTCGGCGGC GACGGCGACG GCGACGGCGG 
CGGCGGTAGG GGCGGGGGAG GTGATCTCCG TCCACAGCCT GGAGCAGTGG 
ACCATGCAGA TCGAGGAGGC CAACGCCGCC AAGAAGCTGG TGGT GATT GA 
CTTCACTGCA TCATGGTGCG GACCATGCCG CATT ATGGCT CCAATTTTCG 
CTGATCTCGC CAAGAAGTTC CCAGCTGCTG TTTTCCTCAA GGTCGACGTT 
15 GATGAACTGA AGCCCATTGC TGAGCAATTC AGCGTGGAGG CCATGCCAAC 
CTTCCTGTTC ATGAAGGAAG GAGATGTCAA GGACAGGGTT GTCGGAGCTA 
TCAAGGAGGA ACTGACGACC AAGGTTGGGC TACACGCGGC CCAGTAATCA 
CCTACCGGAG TAGCATTCGC CTAAATAAAA TTGCCGCTCA ACAAGTAGTG 
CCTCTAATGG CACCTTATAT CCTGTGTACT GCTTGTTACT TGTTGGTTTA 
20 TGGATAATGG TGAATCAAGT GTGACTTTAT TCGGTAAATG GTTGATTTTC 
GTAAGGAGCT GATCGAATTC AGTTGTTCGG CTATAGGCAA AAAAAAAAAA 
AAAAAAAAA 

L'extrSmite 5' de cette sequence comprend une 
25 sequence de 6 3 paires de bases (pb) non codante, 
suivie d'une phase de lecture ouverte de 381 pb, puis 
d'une sequence non codante de 215 pb, a l'extrimite 
3' . 

La phase de lecture ouverte code pour une 
30 proteine de 127 acides amines de sequence SEQ ID N*2. 

La masse theorique de la proteine codee par 
cette phase de lecture ouverte est de 13524D. 
EXEMPLE 2 : 

Obtention de clone de thioredoxine h de ble dur. 
35 11 Construction de la b anoue d'ADN 

complementaire de ble dur. 

La banque est obtenue de maniere similaire a 
celle de l'exemple 1 a 1* exception du materiel vegetal 
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utilise qui est Triticum durum Desf. Variete Agathe. 
Les ARN totaux sont isoles de grains 22 jours apres 
f loraison. 

Les ARN messagers isoles par chromatographic 
5 d'af finite sur oligo dT cellulose sont clones dans le 
plasmide pUC118 dans le site de clonage Pstl. 

La souche d 1 Escherichia coli JM109 est 
transformee avec les plasmides obtenus. 

La methode de fabrication de cette banque d'ADN 
10 complementaire est mise en oeuvre de la maniere 
decrite par Gautier et al. (Plant Molecular Biology, 
14 , 313-322, 1990) dont la publication est incluse par 
reference a la presente demande. 

2 . Isolement d'un clone codant pour une 
15 thioredoxlne h de ble dur. 

Des clones sont cribl6s comme indiqu6 dans 
I'exemple 1 par le meme melange d f oligonucleotides de 
synthese ( SEQ ID N* 6). 

Un clone, denomme pTdl4132 est isole et sa 
20 sequence est determinee comme indique dans I'exemple 
1. 

Ce clone comprend la sequence d'ADN 
complementaire de ble dur suivante : 

25 SEQ ID N"8 

CGTGAGAAAT AAGCGGTGCT TGCCAAGCAG AGAGAGAGAG AGAGAGAGAG 
ATGGCGGCGG CGGCGACGGC GACGACTACA GCGGCGGCGA CGGCGGCGGC 
GGTGGGGCCG GGGGAGGTGA TCTCCGTCCA CAGCCTGGAG CAGTGGACCA 
30 TGCAGATCGA GGAGGCCAAC GCCGCCAAGA AGCTGGTGGT GATTGACTTC 
ACTGCATCAT GGTGCGGACC ATGCCGCATC ATGGCTCCAA TTTTTGCTGA 
TCTCGCCAAG AAGTTCCCAG CTGCTGTTTT CCTCAAGGTC GACGTTGATG 
AACTGAAGCC CATTGCTGAG CAATTCAGCG TCGAGGCCAT GCCAACCTTC 
CTGTTCATGA AGGAAGGAGA CGTCAAGGAC AGGGTTGTCG GAGCTATCAA 
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GGAGGAGCTG ACGACCAAGG TTGGGCTCCA CGCGGCTGCC TAGTAATCAC 
CTAGCGGAGT AGTATTCGCC TAAATAAAAT TGCCGCTTGA GAAGTAGTGC 
CTCCAATGGC ACCGGATATG CTGTGTACTG CTTGCTTCTT GTGAGTTTAT 
GGATGATGGT GAATCAAGTG TGACTTTATT CGGTAAATGG TTGATTTCAT 
5 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 

L' extremity 5' de cette sequence comprend une 
partle non codante de 50 bp, puis une phase de lecture 
ouverte de 390 pb puis une partie non codante de 190 
pb a son extremite 3 ' . 
10 La phase de lecture ouverte correspond a une 

proteine de 130 acides amines, ayant une masse 
moleculaire theorique de 13750D. 
EXEMPLE 3 : 

ronmaralson ries struct ures primaires des thioredoxlnes 
15 h de bles dur et tendre et des autres thioredoxlnes h 
divulouees dans l'etat de la technique. 

Les structures primaires des deux proteines 
correspondant aux clones pTaM1338 et P Tdl4132 ont ete 
comparees entre elles et aux structures primaires de 
20 thioredoxlnes h de riz ( THIORIZ), de thioredoxine h 
d'Arabidopsis (THIOARA) , de thioredoxine h2 de tabac 
(THIOTABAC 2 ) , de thioredoxine hi de tabac (THIOTABAC) 
et de thioredoxine h de chlamydomonas reinhardtii 
(THIOCHLA) . 

25 Les resultats de ces comparaisons sont repris 

dans la figure 1. 

Dans cette figure les acides amines sont 
representee par le code a une lettre et (*) represente 
une position d'acide amine identique dans les sept 
30 proteines, tandis que (.) represente une position 
d'acide amine similaire. 

Sur une longueur totale de 138 acides amines, 
on observe une conservation a 1' identique pour 31 
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acides amines (22,5 %) et une similarity pour 42 
acides amines ( 30,4 %). 

II ressort done clairement de cette figure que 
les thioredoxines h de bles montrent une faible 
5 identite de sequence avec les autres thioredoxines h 
de vegetaux deja sequences. 

De maniere surprenante, 1' identite de sequence 
entre d'une part la thioredoxine h de riz et d 1 autre 
part les thioredoxines h de ble tendre et de ble dur 
10 n'est que de respectivement 54 , 9% et 55 , 7 %, alors que 
ces plantes sont toutes trois des graminees. 
EXEMPLE 4; 

Production de thioredoxine h par des bacteries. 

1. Sous-clonaae de la sequence codant pour la 
15 thioredoxine h de ble tendre dans un vecteur 

d'exoresslon d'E.coll; 

Le DNA plasmidique pTAM1338 contenant la 

sequence d'ADNc codant pour la thioredoxine h de ble 

tendre (Triticum aestivum) a ete modifie par 
20 mutag6n6se dirigee pour introduire les sites de 

restriction Ndel et BamHI respectivement en 5 ' et 3 1 

de la sequence codant pour la proteine. 

Ces sites de restriction ont ensuite servi a 

introduire la sequence codant pour la thioredoxine h 
25 de ble tendre (Triticum aestivum) dans le vecteur 

d* expression pET3b commercialise par Novagen (USA) et 

decrit par Rosenberg et al., (Gene, 56, 125-135, 1987) 

digere par les memes enzymes. 

La figure 2 illustre cette construction. 
30 Le vecteur pET3b est une molecule d'ADN 

circulaire derive de pBR322; il contient les elements 

suivants : 

- le promoteur du gene 10 reconnu par l'ARN 
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polymerase T7 (appele PO10) contenu entre les sites de 
restriction Bglll et Xbal, 

- la sequence Shine-Dalgarno du gene 10, 

- un codon d' initiation ATG contenu dans le 
5 site unique de restriction Ndel en 5' des premiers 

codons du gene 10/ 

- un site de restriction unique BamHI qui 
permet de doner une sequence d'un gene Stranger dans 
le vecteur d ' expression, 

10 - le terminateur de transcription qui suit 

normalement le gene 10(TO). 

Ce vecteur possede le replicon pMBl (ori) et 

contient le gene tola qui code pour la resistance a 

l'ampiciline (ampR). 
15 La sequence codant pour la thioredoxine h de 

ble tendre incluse entre les sites de restriction Ndel 

et BamHI qui ont ete crees par mutagenese dirigee est 

introduite dans le vecteur d' expression digere par les 

memes enzymes . 

20 Le vecteur resultant pETtrxTa est utilise pour 

transformer des souches d'E. coli. 

Les methodes conventionnelles de clonage ont 
ete utilisees. Elles sont decrites par Maniatis et al. 
(1982). Molecular Cloning: A Laboratory Manual, 2nd 
25 Ed., Cold Spring Harbor Laboratory, New York. 

Le plasmide pETtrxTa resultant de la 
construction a ete sequence comme decrit par Sanger et 
al. (1977, Proc. Natl. Acad. Sci . USA 74, 5463-5467), 
dans le but de verifier qu'aucune mutation n'a ete 
30 introduite dans la sequence de la thioredoxine h au 
cours de 1 ' amplification ou du clonage. 

La sequence codant pour la thioredoxine h peut 
aussi etre introduite dans le vecteur d' expression 
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apres modification, par mutagenese dirigee, d'un ou 
plusieurs acides amines de la proteine dans le but de 
changer ses proprietes . Les methodes conventionnelles 
de mutagenese dirigee sont decrites par Maniatis et 
5 al. (1982, precedemment cite). 

2, Obtention de bacteries produisant de la 
thioredoxine ht 

Le vecteur pETtrxTa qui contient la sequence 
codant pour la thioredoxine h de ble sous controle du 

10 promoteur reconnu par l'ARN polymerase du 
bacteriophage T7 est utilise pour transformer des 
souches d'E. coli (Hanahan et al., 1985, Technique for 
transformation of E . coli in "DNA Cloning: A practical 
Approach "(Glover , D.M.Ed. Vol.1, pp 109-135, IRL 

15 Press, Oxford), capables de synthetiser l'ARN 
polymerase T7 . De telles souches sont commercialisees 
par Novagen (USA) et decrites par Studier et al., 
(1990, Methods Enzymol. 185, 60-89). Elles peuvent 
etre: 

20 -BL21 (DE3) : ompT hsdS gal ( lambda clts857 

indl Sam7 nin5 lacUV5-T7 genel), 

-BL21 (DE3)pLysE: meme genotype que BL21 (DE3) 
excepte le plasmide pLysE qui derive du plasmide 
pACYC184 (Chang et al., 1978 , J.Bacteriol. 134-1141) 

25 et contient le g&ne codant pour le lysozyme T7 ainsi 
que le gene de resistance au chloramphenicol. Le gene 
codant pour le lysozyme est exprime a partir du 
promoteur tet de pACYC184 ce qui signifie que les 
bacteries qui portent ce plasmide accumulent un taux 

30 important de lysozyme. 

-BL21 {DE3)pLysS: meme genotype que BL21 
(DE3 )pLysE mais le gene codant pour le lysozyme est 
insere dans 1 1 orientation opposee. En consequence, les 
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bacteries qui portent ce plasmide accumulent une 
quantite beaucoup plus faible de lysozyme. 

Les bacteries trans formees sont multipliees 
dans le milieu de Luria-Bertani avec les antibiotiques 
5 necessaires, a 30*C. 

3 . Analyse de 1' expression de la thioredoxine h 
dans les bacteries, 

Les bacteries contenant le vecteur pETtrxTa 
sont cultivees jusqu'a une denslte optique comprise 
10 entre 0,3 et 0,6 a 600 nm, (une fraction aliquote 
avant induction est conservee pour analyse). 
L'inducteur de 1" expression de l'ARN polymerase T7 
(IPTG 0-1 mM) est alors ajoute au milieu de culture 
pour permettre 1' expression de la thioredoxine h et 
15 les bacteries sont collectees par centrifugation apres 
3 ou 6 h d* induction. 

Les bacteries induites sont lysees par les 
methodes conventionnelles et le lysat contenant les 
proteines totales est centrifuge pour separer la 
20 fraction "proteines insolubles" (culot) de celle des 
"proteines solubles" ( surnageant). 

Le surnageant qui contient l'activite 
thioredoxine h, identifiee par dosage de la reduction 
de la malate dehydrogenase comparable au temoin 
25 extrait de ble, est chauffe a 60 - C (5 min.) et 
centrifuge pour separer la fraction des proteines 
thermostables (surnageant) des autres proteines. 

Les echantillons des differentes fractions sont 
traites avec le tampon de charge de Laemlli (Laemlli, 
30 1970, Nature, 227, 680-685), chauffS 5 a 10 minutes 
dans un bain marie bouillant et analyse par gel de 
sodium dodecyl sulf ate-polyacrylamide . 

Une proteine de la taille attendue pour une 
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thioredoxine h de ble est presente dans le lysat des 
proteines totales de bacteries induites et reste 
soluble meme apres chauffage a 60*C; le meme gel est 
trans fere sur une membrane de nitrocellulose (Towbin 
5 et al., 1979, Proc. Natl. Acad. Sci. USA 76, 435P- 
4354), et incube avec un anticorps dirlge contre la 
thioredoxine h de ble. La proteine, de taille 
attendue, synthetisee dans le cytoplasme bacterien 
apres induction, reagit avec 1' anticorps. 

10 Les figures 3 et 4 representent respectivement 

un gel de polyacrylamide-SDS apres coloration au bleu 
de Coomassie et un Western-Blot effectue avec un 
anticorps dirige contre la thioredoxine h de ble, de : 
1. lysat de bacteries avant induction, 

15 2 . culot des proteines insolubles du lysat 

apres 3h d' induction, 

3. culot apres chauffage des proteines solubles 

du lysat, 

4. surnageant apres chauffage des proteines 

20 solubles du lysat, 

5. comme 2 apres 6h d' induction, 

6. comme 3 apres 6h d' induction, 

7. comme 4 apres 6h d' induction. 

A. Purification de la thiore doxine h de ble. 

25 Les conditions de purification utilisees 

suivent essentiellement le protocole decrit par de 
Lamotte-Guery et al., ((1991) Eur. J. Biochem. 196, 
287-294). Les bacteries sont recoltees apres induction 
de 4h selon les conditions decrites plus haut et 

30 resuspendues dans un tampon 30 mM Tris/HCl pH 7,9 et 1 
mM EDTA (tampon A) . 

Apres un cycle de congelation (- 
20*C)/decongelation les cellules sont lysees avec une 
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10 



15 



presse de French et le lysat alnsi obtenu eat 
centrifuge a 4*C, 30 minutes a 50 000 g pour recuperer 
la fraction surnageante qui est ensuite chauffee a 

60* C, 5 minutes. 

Les proteines denaturees par le traitement a 
chaud sont centrifugees comrae precedemment . Le 
surnageant contient principalement la thioredoxine h. 
Elle peut etre purifiee par precipitation au sulfate 
d' ammonium (35-80 %) suivie d'une chromatographic 
d' exclusion (Sephadex G-50) et d'une chromatographie 
echangeuse d'ions (Q-Hyper D) . 

Cette derniere chromatographie est realisee 
avec un gradient de 0 a 200 mM NaCl, la thioredoxine h 
de ble produite dans E.coli est eluee a une 
concentration de 90 mM NaCl . La mesure de l'activite 
de la thioredoxine h (mesure de 1' activation de la 
malate dehydrogenase a NADP selon Jacquot et 
al.((1981), Plant Physiol., 68, 300-304) a chaque 
etape aide a suivre la purification. 

EXEMPLE 5 : Production de th ioredoxine h — par — des 

levures . 

l. Construction de pF L61trxTa; 

Le fragment correspondant a la sequence codante 
de pTaM1388 est amplifie en utilisant deux 
25 oligonucleotides de synthese s'hybridant aux regions 
15-34 et 482-502 et un site de restriction NotI est 
ajoute a chaque extremite. 

Le fragment resultant est insere dans le 
vecteur pFL61 represente sur la figure 5 ( Lacroute, 
(1992) Plant J. 2 (3), 417-422) prealablement lin§arise 
par NotI. 

Le sens d' insertion et la sequence sont 
controles. Le vecteur resultant est appele pFL61trxTa. 
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2. Construction de pVTUtrxTa; 

La sequence de I'ADNc codant pour la 
thioredoxine h de ble tendre issue de pTaM133B est 
isolee apres digestion par BamHI et Ndel du plasmide 

5 pETtrxTa (plasmide pET portant la sequence codante de 
pTaM1338) puis ins6ree dans le vecteur pVTUtrxTa 
represents sur la figure 6, (Vernet et al . (1987) Gene 
52 # 225-233 ) au niveau du site de clonage Pvu II. Le 
vecteur resultant est appele pVTUtrxTa. 

0 3. Conditions de purification: 

Les levures (souche OL1 et YPH 250) sont 
transformees par pVTUtrxTa et sont cultivees en milieu 
liquide a 30* C et en conditions sfilectives, permettant 
le maintien des plasmides dans les cellules jusqu'a 

5 une absorbance a 550 nm de 1, puis sont transferees en 
milieu riche pendant 16 heures. 

Ceci permet d'augmenter la biomasse et le 
faible nombre de divisions ayant lieu pendant cette 
duree de temps limite les effets de perte de plasmide. 

0 Les cellules sont ensuite cassees par passage dans un 
broyeur a billes ou par incubation dans de 
I'ammoniaque. Les conditions de purification de la 
proteine recombinante a partir du lysat cellulaire 
sont celles decrites par de Lamotte et al.( (1991). 

5 Eur. J. Biochem. 196, 287-294). 

Les deux souches de levures transformees 
produisent des thioredoxines h decelables par 
immunoempreintes . 

La souche YPH252 deposee a I'ATCC peut aussi 

10 etre utilisee. 
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LISTE DE SEQUENCES 



(1) INFORMATION GENERALE : 

U) D (a? S nS! institut National de la Recherche Agronomique 

TV1D & 



INRA 

(B) RUE : 147 rue de l'univeraite 

(C) VILLE: Paris 
{ E) PAYS: France 

(F) CODE POSTAL: 75348 

lltlnl piSr els protein., et precedes detention 
(iii) KOMBRE DE SEQUENCES: B 

(iv) FORME LISIBLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy dlsK 
)n? ntmiNATEUR: IBM PC compatible 

(2) INFORMATION POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 109 acides amines 

(B) TYPE: acide amine" 

(D) CONFIGURATION: lineaira 

(ii) TYPE DE MOLECULE: peptide 

(iii) HYFOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: Triticum aestivum 

<xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 1: 

Cly Glu val He Ser Val His Ser Leu Glu Gin Tr P Thr Met Gin He 

1 5 

Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val lie Asp Phe Thr Ala 

20 25 
Ser Trp Cys Gly Pro Cys Arg lie Met Ale Pro lie Phe Ala Asp Leu 

35 40 
Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp Glu 

50 55 
Leu Lys Pro lie Ala Glu Gin Phe Ser Val Glu Ala Met Pro Thr Phe 
65 70 " 
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Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg Val Val Gly Ala lie 
85 90 95 

Lys Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala Ala 
100 105 

{2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 384 palres de bases 

(B) TYPE: acide nuclilque 

(C) NOMBRE DE BRINS: deux 

(D) CONFIGURATION: lineaire 

(il) TYPE DE MOLECULE: ADNc pour ARNm 

(ill) HYPOTHETIQUE: NON 

(vl) ORIGINE: 

(A) ORGANISMS : Tritlcum aestlvum 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1..3B1 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

ATG GCG GCG TCG GCG GCG ACG GCG ACG GCG ACG GCG GCG GCG GTA GGG 4 8 

Met Ala Ala Ser Ala Ala Thr Ala Thr Ala Thr Ala Ala Ala Val Gly 

15 10 15 

GCG GGG GAG GTG ATC TCC GTC CAC AGC CTG GAG CAG TGG ACC ATG CAG 

Ala Glv Glu Val He Ser Val His Ser Leu Glu Gin Trp Thr Met Gin 

1 25 30 



20 



96 



ATC GAG GAG GCC AAC GCC GCC AAG AAG CTG GTG GTG ATT GAC TTC ACT 144 

He Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val lie Asp Phe Thr 
35 40 45 

GCA TCA TGG TGC GGA CCA TGC CGC ATT ATG GCT CCA ATT TTC GCT GAT 19 2 

Ala Ser Trp Cys Gly Pro Cys Arg lie Ket Ala Pro He Phe Ala Asp 
50 55 60 

CTC GCC AAG AAG TTC CCA GCT GCT GTT TTC CTC AAG GTC GAC GTT GAT 240 

Leu Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp 

65 * " 70 75 80 

GAA CTG AAG CCC ATT GCT GAG CAA TTC AGC GTG GAG GCC ATG CCA ACC 288 

Glu Leu Lys Pro He Ala Glu Gin Phe Ser Val Glu Ala Ket Pro Thr 
85 90 95 

TTC CTG TTC ATG AAG GAA GGA GAT GTC AAG GAC AGG GTT GTC GGA GCT 336 

Phe Leu Phe Ket Lys Glu Gly Asp Val Lys Asp Arg Val Val Gly Ala 
100 105 HO 
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JE £ S! Si S S S K - 5 S StS S S SK 

115 120 

TAA 

(2) INFORMATION POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 127 acides amin6s 

(B) TYPE: acide amin6 

(D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 
K.t Ala Ala Ser Ala Ala Thr Ala Thr Ala Thr Ala Ala Ala Val Cly 

AU Gly Glu Val He Ser Val- Hi. Ser Leu Glu Gin Trp Thr Met Gin 

Ue Glu Glu Ala Asn Ala Ala I*. Lys Leu Val Val lie Asp Phe Thr 

Ala Ser Z cys Gly Pro Cys Arc Ue Met Ala Pro Ue Phe Ala Asp 

Leu All Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp 

Olu Leu Lys Pro lie Ala Glu Gin Phe Ser Val Glu Ala Met Pro Thr 

Phe Leu Phe Kec Lys Glu Gly Asp Val Lys As P Arc Val Val Gly Ala 

100 105 
,1. Lys Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala Ala Gin 

115 120 
(2) INFORMATION POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 393 paires de bases 

(B) TYPE: acide nuclelque 
C NOMBRE DE BRINS: deux 

(D) CONFIGURATION: linealre 

(ii) TYPE DE MOLECULE: ADNc pour ARNm 

(iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISM: Triticum durum 



381 
384 
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(lx) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT: 1. .390 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

rrr urn ACT ACA GCG GCG GCG ACG GCG GCG 
S S S Ma S S S S S 5. Ala Ma Thr Ala Ala 



5 10 



^r. r»r TTO ATC TCC GTC CAC ACC CTG GAG CAG TGG 

S! SI? §55 SS g5? 51? iS K !.i hi. ser Le u cm TrP 

2Q 2 5 

g s S as « s is s s s E s S3 s™ s 
sssssgsssssssssss 

50 55 * 

„„„ aar TTC CCA GCT GCT GTT TTC CTC AAG GTC 

SS S S 25 £ & ™ S2 K «. ».i - «« vjj 

6 5 70 

ss sn ss a qs s s s s ss si s e ss a: s 
K s s s S S 2S K s ss sis e £J 5 511 
s s; s si "» as as s s s K ss § ss a: s 



115 120 



GCT GCC TAG 
Ala Ala 
130 



4B 



96 



144 



192 



240 



288 



336 



384 



393 
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(2) INFORMATION POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 130 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: prot6ine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

Met Ala Ala Ala Ala Thr Ala Thr Thr Thr Ala Ala Ala Thr Ala Ala 
1 5 10 15 

Ala val Gly Pro Gly Glu Val lie Ser Val His Scr Leu Glu Gin Trp 
20 25 30 

Thr Met Gin He Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val He 
35 40 45 

Asp Phe Thr Ala Ser Trp Cys Gly Pro Cys Arg lie Met Ala Pro lie 
50 55 60 

Phe Ala Asp Leu Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val 
65 70 75 80 

Asp Val Asp Glu Leu Lys Pro lie Ala Glu Gin Phe Ser Val Glu Ala 
85 90 95 

Met Pro Thr Phe Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg Val 
100 105 HO 

Val Gly Ala lie Lys Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala 
115 120 125 

Ala Ala 
130 

(2) INFORMATION POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 bases 

(B) TYPE: acide nucl6ique 

(C) NOMBRE DE BRINS: un 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE : NON 

(v) TYPE DU FRAGMENT : interne 



(ix) CARACTERI STIQUE ADDITIONELLE : 
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(A) NOM/CLE: variation 

( B ) EMPLACEMENT: remplace{6, "t") 

(ix) CARACTERISTIQUE ADDITIONELLE: 
(A) NOM/CLE: variation 
( b ) EMPLACEMENT: remplace(9, "a") 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace(12, "g") 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE : mutation 

(B) EMPLACEMENT: remplace(12, M c") 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace ( 12 , "t") 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace(15, "t") 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace ( IB , "a") 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
TGGTGCGGTC CATGCAAGAT G 



21 
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(2) INFORMATION POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 659 paires do bases 

(B) TYPE: acide nucleHque 

(C) NOMBRE DE BRINS: deux 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNC pour ARNm 

(lii) HYPOTHETIQUE: NON 

(vi) ORIGINE : 

(A) ORGANISMS: Triticum aestivum 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

CAAAGTGCGC GTGAGAAATA AGCGGTGCTT GCCCAGTAGA GAGAGAGAGA GAGAGAGAGA 60 

GAGATGGCGG CGTCGGCGGC GACGGdGACG GCGACGGCGG CGGCGGTAGG GGCGGGGGAG 120 

GTGATCTCCG TCCACAGCCT GGAGCAGTGG ACCATGCAGA TCGAGGAGGC CAACGCCGCC 180 

AAGAAGCTGG TGGTGATTGA CTTCACTGCA TCATGGTGCG GACCATGCCG CATTATGGCT 24 0 

CCAATTTTCG CTGATCTCGC CAAGAAGTTC CCAGCTGCTG TTTTCCTCAA GGTCGACGTT 300 

GATGAACTGA AGCCCATTGC TGAGCAATTC AGCGTGGAGG CCATGCCAAC CTTCCTGTTC 360 

ATGAAGGAAG GAGATGTCAA GGACAGGGTT GTCGGAGCTA TCAAGGAGGA ACTGACGACC 420 

AAGGTTGGGC TACACGCGGC CCAGTAATCA CCTACCGGAG TAGCATTCGC CTAAATAAAA 480 

TTGCCGCTCA ACAAGTAGTG CCTCTAATGG CACCTTATAT CCTGTGTACT GCTTGTTACT 54 0 

TGTTGGTTTA TGGATAATGG TGAATCAAGT GTGACTTTAT TCGGTAAATG GTTGATTTTC 600 

GTAAGGAGCT GATCGAATTC AGTTGTTCGG CTATAGGCAA AAAAAAAAAA AAAAAAAAA 659 
(2) INFORMATION POUR LA SEQ ID NO: 8: 

<i1 CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 630 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: deux 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc pour ARNm 

(iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGAN I SKE : Triticum durum 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 



CGTGAGAAAT 


AAGCGGTGCT 


TGCCAAGCAG 


AGAGAGAGAG 


AGAGAGAGAG 


ATGGCGGCGG 


60 


CGGCGACGGC 


GACGACTACA 


GCGGCGGCGA 


CGGCGGCGGC 


GGTGGGGCCG 


GGGGAGGTGA 


120 


TCTCCGTCCA 


CAGCCTGGAG 


CAGTGGACCA 


TGCAGATCGA 


GGAGGCCAAC 


GCCGCCAAGA 


180 


AGCTGGTGGT 


GATTGACTTC 


ACTGCATCAT 


GGTGCGGACC 


ATGCCGCATC 


ATGGCTCCAA 


240 


TTTTTGCTGA 


TCTCGCCAAG 


AAGTTCCCAG 


CTGCTGTTTT 


CCTCAAGGTC 


GACGTTGATG 


300 


AACTGAAGCC 


CATTGCTGAG 


CAATTCAGCG 


TCGAGGCCAT 


GCCAACCTTC 


CTGTTCATGA 


360 


AGGAAGGAGA 


CGTCAAGGAC 


AGGGTTGTCG 


GAGCTATCAA 


GGAGGAGCTG 


ACGACCAAGG 


420 


TTGGGCTCCA 


CGCGGCTGCC 


TAGTAATCAC 


CTAGCGGAGT 


AGTATTCGCC 


TAAATAAAAT 


480 


TGCCGCTTGA 


GAAGTAGTGC 


CTCCAATGGC 


ACCGGATATG 


CTGTGTACTG 


CTTGCTTCTT 


540 


GTGAGTTTAT 


GGATGATGGT 


GAATCAAGTG 


TGACTTTATT 


CGGTAAATGG 


TTGATTTCAT 


600 


AAAAAAAAAA 


AAAAAAAAAA 


AAAAAAAAAA 








630 
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RKVRNDICATIONS 

1. Proteine presentant une similitude de 
sequence d'au moins 65% avec la sequence SEQ ID N* 1 
suivante : 

Gly Glu Val He Ser Val His Ser Leu Glu Gin Trp Thr 
Met Gin He Glu Glu Ala Asn Ala Ala Lys Lys Leu Val 
Val He Asp Phe Thr Ala Ser Trp Cys Gly Pro Cys Arg 
He Met Ala Pro He Phe Ala Asp Leu Ala Lys Lys Phe 
Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp Glu Leu 
Lys Pro He Ala Glu Gin Phe Ser Val Glu Ala Met Pro 
Thr Phe Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg 
Val Val Gly Ala He Lys Glu Glu Leu Thr Thr Lys Val 
Gly Leu His Ala Ala 

2 . Proteine selon la revendication 1 
caracterisee en ce qu'elle presente une similitude de 
sequence avec la sequence SEQ ID N'l d'au moins 75 % 
et preferentiellement d'au moins 85 %. 

3. Thioredoxine h de ble tendre selon l'une des 
revendlcations 1 et 2 presentant la sequence suivante: 
SEQ ID N'3 

Met Ala Ala Ser Aia Ala Thr Ala Thr Ala Thr Ala Ala 
Ala Val Gly Ala Gly Glu Val He Ser Val His Ser Leu 
Glu Gin Trp Thr Met Gin He Glu Glu Ala Asn Ala Ala 
Lys Lys Leu Val Val He Asp Phe Thr Ala Ser Trp Cys 
Gly Pro Cys Arg He Met Ala Pro He Phe Ala Asp Leu 
Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val Asp 
Val Asp Glu Leu Lys Pro He Ala Glu Gin Phe Ser Val 
Glu Ala Met Pro Thr Phe Leu Phe Met Lys Glu Gly Asp 
Val Lys Asp Arg Val Val Gly Ala He Lys Glu Glu Leu 
Thr Thr Lys Val Gly Leu His Ala Ala Gin 
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4, Thioredoxine h de ble dur selon l'une des 
revendications 1 et 2 presentant la sequence suivante: 
SEQ ID N'5 



Met 


Ala 


Ala 


Ala 


Ala 


Thr 


Ala 


Thr 


Thr 


Thr 


Ala 


Ala 


Ala 


Thr 


Ala 


Ala 


Ala 


Val 


Gly 


Pro 


Gly 


Glu 


Val 


He 


Ser 


Val 


His 


Ser 


Leu 


Glu 


Gin 


Trp 


Thr 


Met 


Gin 


He 


Glu 


Glu 


Ala 


Asn 


Ala 


Ala 


Lys 


Lys 


Leu 


Val 


Val 


He 


Asp 


Phe 


Thr 


Ala 


Ser 


Trp 


Cys 


Gly 


Pro 


Cys 


Arg 


He 


Met 


Ala 


Pro 


He 


Phe 


Ala 


Asp 


Leu 


Ala 


Lys 


Lys 


Phe 


Pro 


Ala 


Ala 


Val 


Phe 


Leu 


Lys 


Val 


Asp 


Val 


Asp 


Glu 


Leu 


Lys 


Pro 


He 


Ala 


Glu 


Gin 


Phe 


Ser 


Val 


Glu 


Ala 


Met 


Pro 


Thr 


Phe 


Leu 


Phe 


Met 


Lys 


Glu 


Gly Asp 


Val 


Lys 


Asp 


Arg 


Val 


Val 


Gly Ala 


He 


Lys 


Glu 


Glu 


Leu 


Thr 


Thr 


Lys 


Val 


Gly Leu 


His 


Ala 


Ala 


Ala 




5 


Peptide 


comprenant 


au 


moins un fragment 



d'une des proteines selon l'une des revendications 1 
et 4. 

6. Fragment d'ADN codant pour une des proteines 
selon l'une quelconque des revendications 1 a 4 ou un 

20 des peptides selon la revendication 5. 

7. Fragment selon la revendication 6 codant 
pour la thioredoxine h de ble tendre, caracterise en 
ce qu'il comprend la sequence suivante : 

SEQ ID N'2 

25 

ATGGCGGCGT CGGCGGCGAC GGCGACGGCG ACGGCGGCGG CGGTAGGGGC 
GGGGGAGGTG ATCTCCGTCC ACAGCCTGGA GCAGTGGACC ATGCAGATCG 
AGGAGGCCAA CGCCGCCAAG AAGCTGGTGG TGATTGACTT CACTGCATCA 
TGGTGCGGAC CATGCCGCAT TATGGCTCCA ATTTTCGCTG ATCTCGCCAA 
30 GAAGTTCCCA GCTGCTGTTT TCCTCAAGGT CGACGTTGAT GAACTGAAGC 
CCATTGCTGA GCAATTCAGC GTGGAGGCCA TGCCAACCTT CCTGTTCATG 
AAGGAAGGAG ATGTCAAGGA CAGGGTTGTC GGAGCTATCA AGGAGGAACT 
GACGACCAAG GTTGGGCTAC ACGCGGCCCA GTAA 
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8. Fragment selon la revendicatlon 6 codant 
pour la thioredoxine h de ble dur, caracterise en ce 
qu'il comprend la sequence suivante : 

SEQ ID N* 4 

5 

ATGGCGGCGG CGGCGACGGC GACGACTACA GCGGCGGCGA CGGCGGCGGC 
GGTGGGGCCG GGGGAGGTGA TCTCCGTCCA CAGCCTGGAG CAGTGGACCA 
TGCAGATCGA GGAGGCCAAC GCCGC CAAGA AGCTGGTGGT GATTGACTTC 
ACTGCATCAT GGTGCGGACC ATGCCGCATC ATGGCTCCAA TTTTTGCTGA 
10 TCTCGCCAAG AAGTTCCCAG CTGCTGTTTT CCTCAAGGTC GACGTTGATG 
AACTGAAGCC CATTGCTGAG CAATTCAGCG TCGAGGCCAT GCCAACCTTC 
CTGTTCATGA AGGAAGGAGA CGTCAAGGAC AGGGTTGTCG GAGCTATCAA 
GGAGGAGCTG ACGACCAAGG TTGGGCTCCA CGCGGCTGCC TAG 

9 . Vecteur nucleotidique portant un fragment 
15 d'ADN selon l'une des revendications 6 a 8. 

10. Vecteur appele pETtrxTa selon la 
revendicatlon 9 portant la sequence SEQ ID N'2, depose 
aupres de la CNCM sous le n B 1-1442. 

11. Vecteur appele pFL61trxTa selon la 
20 revendicatlon 9 portant la sequence SEQ ID N'2, depose 

aupres de la CNCM sous le n* 1-1443. 

12. Microorganisme portant un vecteur selon 
l'une des revendications 9 a 11. 

13. Microorganisme selon la revendicatlon 12 
25 caracterise en ce qu f il est une baoterie ou une 

levure . 

14. Methode de selection dans une banque d'ADN 
complementaires de clones codant pour une thioredoxine 
h caracterisee en ce que l'on hybride lesdits clones 

30 avec une sonde presentant une similitude de sequences 
proche de 100 % avec le site actif des thioredoxines . 

15. Methode selon la revendicatlon 14 
caracterisee en ce que ladite sonde presente la 
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sequence suivante : 
SEQ ID N'6 

TGGTGX 1 GGX 2 CCX 3 TGX 4 AAX 5 ATG 
dans laquelle : 
5 represente C ou T 

X 2 represente T ou A 

X 3 represente A, G, C ou T 

X 4 represente C ou T 

X 5 represente G ou A 
10 16. Procede de production de proteines et de 

peptides selon 1 1 une des revendications 1 a 5 , et en 
particulier de thioredoxines h comprenant les etapes 
suivantes : 

- culture d'un microorganisme selon I'une des 
15 revendications 12 et 13 / et 

- isolement des proteines ou peptides selon 
l'une des revendications 1 a 5 produits par ledit 

microorganisme . 

17. Procede selon la revendication 16 
20 caracterise en ce que les microorganismes sont lyses 

apres culture. 

18. Plante transgenique caracterisee en ce 
qu'elle porte un fragment d'ADN selon l'une des 
revendications 6 a 8. 
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THIOBLETA MAASAA TATATAAAVGAGEVISVHSLEQWTMQIEEANAAKKLVVIDFTASWC 52 

THIOBLETD MAAAATATTTAAATAAAVGPGEVISVHSLEQWTMQIEEANAAKKLWIDFTASWC 5 5 

TH IORI Z MAA EE GWI ACHNKDEFDAQMTKAKEAGKWI IDFTASWC 4 0 

THIOARA MA SEE GQVIACHTVETWNEQLQKANESKTLVVVDFTASWC 4 0 

THIOTABAC2 MA EE GQV I GVHTVD AWN EH LQKG I DDKKL I WDFTASWC 3 9 

THIOTABAC MAANDATSSEE GQVFGCHKVEEWNEYFKKGVETKKLVWDFTASWC 4 6 

TH IOCHLA GGSVIVI DSKAAWDAQLAKGKEEHKPI WDFTATWC 3 6 

* * ****** 



THIOBLETA GPCRIMAPIFABLAKKFPA-AVFLKVDVDELKPIAEQFSVEAMPTFLFMKEGDVK 106 

THIOBLETD GPCRIMAPIFADLAKKFPA-AVFLKVDVDELKPIAEQFSVEAMPTFLFMKEGDVK 109 

THIORIZ GPCRFIAPVFAEYAKKFPG-AVFLKVDVDELKEVAEKYNVEAMPTFLFIKDGAEA 94 

THIOARA GPCRFIAPFFADLAKKLPN-VLFLKVDTDELKSVASDWAIQAMPTFMFLKEGKIL 94 

THIOTABAC 2 GPCKFIASFYAELAKKMPT-VTFLKVDVDELKSVATDWAVEAMPTFMFLKEGKIV 93 

THIOTABAC GPCRF I AP ILADIAKKMPH - VIFLKVDVDELKTVSAEWSVEAMPTFVFIKDGKEV 100 

THIOCHLA G PCKM I A PLFETLSNDYAGKVI FLKVDVDAVAAVAEAAG I TAMPTFHVYKDGVKA 91 



THIOBLETA DRWGA I KEELTTKVGLHAAQ 127 

THIOBLETD DRWGA I KEELTTKVGLHAAA 13 0 

TH I ORI Z DKWG ARKDDLQNTI VKHVG ATAA S AS A 122 

THIOARA DKWGAKKDELQSTIAKHL A 114 

THIOTABAC2 DKWGAKKDELQQTIAKHISST- -S-TA 118 

THIOTABAC DRWGAKKEELQQTIVKHAAPA- -TVTA 12 6 

THIOCHLA DDLVGASQDKLKALVAKHAAA 112 

* * * * * * 



FIG - X 
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FIG - 4 

FEUILLE 0E REMPLACEMENT (REGIE 26) 



WO 96/03505 



4/5 



PCI7FR95/01005 



,= Bbe I 235 



CfrlO I 4518. 



pVu II 306 
coR I 396 
Sac I 402 
cJ136 I 402 
,sp 718 408 
pn I 40£ 



.Sma 1412 
^va I 412 
_Xma I 412 
J<ba I 423 



amHI 417 
spMI 585 
ml I 709 




(IMI 1051 

ot I1253 
stX I 1260 
Isc I 1277 
;stx I 1280 
ot I 1291 

Hind HI 1553 



Xcm I 2481 
Bsg I 2646 



Nco I 2406 
EcoR V 2425 



Stu I 2177 
Bsp 120 I 2237 
Apa I 2237 
Bsm I 2255 
BstB I 2347 



FIG - 5 



FEU1LLE DE REMPLACEMENT (REGIE 26) 
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